arxiv：2408.13890v1 [cs.cv] 2024年8月25日__

arxiv：2408.13890v1 [cs.cv] 2024年8月25日

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

arxiv：2408.13890v1 [cs.cv] 2024年8月25日

¥ 1.0

热度

摘要。自动驾驶（AD）的数据驱动方法在过去十年中已被广泛采用，但面临着数据集偏见和无法解释性。受到人类驾驶的知识驱动性质的启发，最近的方法探讨了大型语言模型（LLMS）的潜力，以改善交通情况中的理解和决策。他们发现，使用经过三通链（COT）推理过程的下游数据上LLM的预处理范式可以增强可解释性和场景的理解。，这种流行的策略被证明遭受了臭名昭著的概率，而精制的婴儿床与随之而来的决策不符，而这种决策仍未受到以前基于LLM的AD方法的影响。为了解决这个问题，我们激励了基于多模式的LLM的端到端决策模型，该模型同时执行COT推理并执行计划结果。fur-hoverore，我们提出了配对的婴儿床和计划结果之间的推理决策对准约束，并在推理和决策之间施加了对应关系。此外，我们重新设计了COTS，以使模型能够理解复杂的方案并增强决策绩效。我们将建议的大型语言规划师与推理决策对齐为RDA驱动器。对Nuscenes和Drivelm-Nuscenes基准的实验评估证明了我们的RDA驱动器在增强最终AD系统性能方面的有效性。具体来说，我们的RDA驱动程序在Nuscenes数据集上实现了最先进的计划性能，具有0.80 L2误差和0.32的碰撞率，并且在挑战Drivelm-nuscenes基准方面取得了领先的结果，具有0.82 L2 L2误差和0.38碰撞率。

添加pdf代下载 VIP点击下载文件